通过边界估计可以显着简化求解约束优化问题(COP),即提供成本函数的紧密边界。通过使用由已知边界的数据组成的数据以及COMPS提取的特征来馈送监督机器学习(ML)模型,可以训练模型以估计新COP实例的边界。在本文中,我们首先概述了来自问题实例的约束编程(CP)的ML的现有知识体系。其次,我们介绍了应用于支持CP解算器的工具的边界估计框架。在该框架内,讨论并评估了不同的ML模型,并评估其对边界估计的适用性,并避免避免求解器找到最佳解决方案的不可行估计的对策。第三,我们在七个警察中提出了一种实验研究,与不同的CP溶剂。我们的结果表明,可以仅限于这些警察的近似最佳边界。这些估计的边界将客观域大小减少60-88%,可以帮助求解器在搜索期间提前找到近乎最佳解决方案。
translated by 谷歌翻译
Our goal with this survey is to provide an overview of the state of the art deep learning technologies for face generation and editing. We will cover popular latest architectures and discuss key ideas that make them work, such as inversion, latent representation, loss functions, training procedures, editing methods, and cross domain style transfer. We particularly focus on GAN-based architectures that have culminated in the StyleGAN approaches, which allow generation of high-quality face images and offer rich interfaces for controllable semantics editing and preserving photo quality. We aim to provide an entry point into the field for readers that have basic knowledge about the field of deep learning and are looking for an accessible introduction and overview.
translated by 谷歌翻译
Recent neural rendering approaches greatly improve image quality, reaching near photorealism. However, the underlying neural networks have high runtime, precluding telepresence and virtual reality applications that require high resolution at low latency. The sequential dependency of layers in deep networks makes their optimization difficult. We break this dependency by caching information from the previous frame to speed up the processing of the current one with an implicit warp. The warping with a shallow network reduces latency and the caching operations can further be parallelized to improve the frame rate. In contrast to existing temporal neural networks, ours is tailored for the task of rendering novel views of faces by conditioning on the change of the underlying surface mesh. We test the approach on view-dependent rendering of 3D portrait avatars, as needed for telepresence, on established benchmark sequences. Warping reduces latency by 70$\%$ (from 49.4ms to 14.9ms on commodity GPUs) and scales frame rates accordingly over multiple GPUs while reducing image quality by only 1$\%$, making it suitable as part of end-to-end view-dependent 3D teleconferencing applications. Our project page can be found at: https://yu-frank.github.io/lowlatency/.
translated by 谷歌翻译
在预测和健康管理(PHM)领域内,可以使用健康指标(HI)来帮助生产,例如安排维护并避免失败。但是,HI通常经过特定的过程设计,通常需要大量的历史数据进行设置。对于中小企业来说,这尤其是一个挑战,这种挑战通常缺乏足够的资源和知识来从PHM中受益。在本文中,我们提出了Modularhi,这是在没有历史数据的系统的HI构建中的模块化方法。使用ModularHi,操作员可以选择哪些传感器输入可用,然后Modularhi将根据在燃烧状态期间收集的数据计算基线模型。然后,该基线模型将用于检测系统是否随着时间的推移开始降解。我们在两个开放数据集,CMAPS和N-CMAPS上测试模块化。以前数据集的结果展示了我们系统检测降解的能力,而后者的结果是在该区域内进行进一步研究的方向。结果表明,我们的新方法能够在没有历史数据的情况下检测系统降解。
translated by 谷歌翻译
在形状分析中,基本问题之一是在计算这些形状之间的(地球)距离之前对齐曲线或表面。为了找到最佳的重新训练,实现这种比对的是一项计算要求的任务,它导致了在差异组上的优化问题。在本文中,我们通过组成基本差异性来解决近似问题,构建了定向性扩散的近似值。我们提出了一种在Pytorch中实施的实用算法,该算法既适用于未参考的曲线和表面。我们得出了通用近似结果,并获得了获得的差异形态成分的Lipschitz常数的边界。
translated by 谷歌翻译
在www.aicrowd.com平台上托管的学习竞赛自主赛车虚拟挑战由两个曲目组成:单摄像头和多相机。我们的Uniteam团队是单个相机轨道中的最终获胜者之一。该代理必须在最短时间内通过以前未知的F1风格轨道,而越野驾驶量最少。在我们的方法中,我们将U-NET体系结构用于道路细分,各种自动编码器编码道路二进制面具以及最近的邻居搜索策略,该策略选择给定状态的最佳动作。我们的经纪人在第1阶段(已知赛道)的平均速度为105 km/h,在第2阶段(未知轨道)上达到了73 km/h,而没有任何越野驾驶。在这里,我们提出解决方案和结果。代码实施可在此处提供:https://gitlab.aicrowd.com/shivansh beohar/l2r
translated by 谷歌翻译
神经辐射场(NERFS)增加了新型视图合成和场景重建的重建细节,其应用程序从大型静态场景到动态人类运动不等。但是,此类神经领域的分辨率和无模型性质的增加是以高训练时间和过度记忆要求为代价的。最近的进步通过使用互补的数据结构改善了推理时间,但这些方法不适合动态场景,并且通常会增加记忆消耗。减少培训时所需的资源几乎没有做到。我们提出了一种方法,通过部分共享相邻样本点的评估来利用NERF基于样本的计算的冗余。我们的UNERF体系结构的灵感来自UNET,该架构在网络中间减少空间分辨率,并在相邻样本之间共享信息。尽管这种变化违反了NERF方法中的严格和有意识的依赖性外观和无关的密度估计的分离,但我们表明它改善了新型观点的综合。我们还引入了一种替代性亚采样策略,该策略共享计算,同时最大程度地减少视图不变性的侵犯。 UNERF是原始NERF网络的插件模块。我们的主要贡献包括减少记忆足迹,提高准确性以及在训练和推理期间摊销的处理时间减少。在当地的假设较弱的情况下,我们在各种神经辐射场任务上实现了改进的资源利用。我们演示了对静态场景的新观点综合以及动态人类形状和运动的应用。
translated by 谷歌翻译
诸如关键点之类的结构化表示形式被广泛用于姿势传输,条件图像生成,动画和3D重建。但是,他们的监督学习需要每个目标域的昂贵注释。我们提出了一种自我监督的方法,该方法学会从外观上脱离对象结构,并用直边链接的2D关键点的图形。只有描绘同一对象类的图像集合,都学会了关键点的位置及其成对边缘权重。该图是可以解释的,例如,当应用于显示人的图像时,自动链接会恢复人类骨架拓扑。我们的关键要素是i)一个编码器,该编码器可预测输入图像中的关键点位置,ii)共享图作为一个潜在变量,该图形在每个图像中链接了相同的对键点,iii)一个中间边缘映射,结合了潜在图形边缘权重和关键点的位置以柔软,可区分的方式以及iv)在随机掩盖的图像上的介入目标。尽管更简单,但自动链接在已建立的关键点上优于现有的自我监督方法,并构成估计基准,并为更多样化的数据集上的结构调节生成模型铺平了道路。
translated by 谷歌翻译
伤害分析可能是基于深度学习的人类姿势估计的最有益的应用之一。为了促进进一步研究本主题,我们为高山滑雪提供了伤害特定的2D数据集,总计533个图像。我们进一步提出了一个后处理程序,它将旋转信息与简单的运动模型相结合。我们可以将秋季情况的检测结果提高到21%,关于pck@0.2指标。
translated by 谷歌翻译
本文解决了3D人类姿势估计模型的交叉数据集泛化问题。在新数据集上测试预先训练的3D姿势估计值会导致主要的性能下降。以前的方法主要通过改善培训数据的多样性来解决这个问题。我们认为单独的多样性是不够的,并且训练数据的特征需要适应新数据集的那些,例如相机观点,位置,人类动作和体型。为此,我们提出了一种完全的端到端框架,该端到端框架从源数据集生成合成3D人体运动,并使用它们来微调3D姿势估计器。适配遵循对抗培训计划。来自源3D构成发电机生成一系列3D姿势和用于将生成的姿势投影到新颖视图的相机方向。如果没有任何3D标签或相机信息,则成功地学习从目标数据集创建合成3D构成,同时仅在2D姿势培训。在Human3.6m,MPI-INF-3DHP,3DPW和SKI-Pose数据集的实验中,我们的方法优于跨数据集评估的先前工作14%和以前的半监督学习方法,使用部分3D注释达到16%。
translated by 谷歌翻译